Much recent work in task-oriented parsing has focused on finding a middle ground between flat slots and intents, which are inexpressive but easy to annotate, and powerful representations such as the lambda calculus, which are expressive but costly to annotate. This paper continues the exploration of task-oriented parsing by introducing a new dataset for parsing pizza and drink orders, whose semantics cannot be captured by flat slots and intents. We perform an extensive evaluation of deep-learning techniques for task-oriented parsing on this dataset, including different flavors of seq2seq systems and RNNGs. The dataset comes in two main versions, one in a recently introduced utterance-level hierarchical notation that we call TOP, and one whose targets are executable representations (EXR). We demonstrate empirically that training the parser to directly generate EXR notation not only solves the problem of entity resolution in one fell swoop and overcomes a number of expressive limitations of TOP notation, but also results in significantly greater parsing accuracy.
translated by 谷歌翻译
深度学习方法已实现了越来越复杂的话语的面向任务的语义解析。但是,单个模型通常仍在分别为每个任务进行培训和部署,需要为每个任务标记培训数据,这使得支持新任务的挑战,即使在单个业务垂直方面(例如,食品订购或旅行预订)也是如此。在本文中,我们描述了交叉顶部(交叉施加任务取消解析),这是一种在给定垂直方向中复杂语义解析的零摄像方法。通过利用用户从相同的垂直共享词汇和语义相似性请求的事实,对单个跨施加性解析器进行了培训,可以在垂直行业内使用任意数量的任意任务,看不见或看不见。我们表明,跨顶部可以在以前看不见的任务上实现高精度,而无需任何其他培训数据,从而提供了一种可扩展的方法来引导新任务的语义解析器。作为这项工作的一部分,我们发布了食物界数据集,该数据集是一个面向任务的解析数据集中的垂直垂直数据集,其话语和注释来自五个架构,每个架构都来自不同的餐厅菜单。
translated by 谷歌翻译
下一代高分辨率汽车雷达(4D雷达)可以提供额外的高程测量和较密集的点云,从而在自动驾驶中具有3D传感的巨大潜力。在本文中,我们介绍了一个名为TJ4Dradset的数据集,其中包括4D雷达点用于自动驾驶研究。该数据集是在各种驾驶场景中收集的,连续44个序列中总共有7757个同步帧,这些序列用3D边界框和轨道ID很好地注释。我们为数据集提供了基于4D雷达的3D对象检测基线,以证明4D雷达点云的深度学习方法的有效性。可以通过以下链接访问数据集:https://github.com/tjradarlab/tj4dradset。
translated by 谷歌翻译
Ultra-fine entity typing (UFET) aims to predict a wide range of type phrases that correctly describe the categories of a given entity mention in a sentence. Most recent works infer each entity type independently, ignoring the correlations between types, e.g., when an entity is inferred as a president, it should also be a politician and a leader. To this end, we use an undirected graphical model called pairwise conditional random field (PCRF) to formulate the UFET problem, in which the type variables are not only unarily influenced by the input but also pairwisely relate to all the other type variables. We use various modern backbones for entity typing to compute unary potentials, and derive pairwise potentials from type phrase representations that both capture prior semantic information and facilitate accelerated inference. We use mean-field variational inference for efficient type inference on very large type sets and unfold it as a neural network module to enable end-to-end training. Experiments on UFET show that the Neural-PCRF consistently outperforms its backbones with little cost and results in a competitive performance against cross-encoder based SOTA while being thousands of times faster. We also find Neural- PCRF effective on a widely used fine-grained entity typing dataset with a smaller type set. We pack Neural-PCRF as a network module that can be plugged onto multi-label type classifiers with ease and release it in https://github.com/modelscope/adaseq/tree/master/examples/NPCRF.
translated by 谷歌翻译
将优化算法映射到神经网络中,深度展开的网络(DUNS)在压缩传感(CS)方面取得了令人印象深刻的成功。从优化的角度来看,Duns从迭代步骤中继承了一个明确且可解释的结构。但是,从神经网络设计的角度来看,大多数现有的Dun是基于传统图像域展开而固有地建立的,该图像域的展开将一通道图像作为相邻阶段之间的输入和输出,从而导致信息传输能力不足,并且不可避免地会损失图像。细节。在本文中,为了打破上述瓶颈,我们首先提出了一个广义的双域优化框架,该框架是逆成像的一般性,并将(1)图像域和(2)卷积编码域先验的优点整合到限制解决方案空间中的可行区域。通过将所提出的框架展开到深神经网络中,我们进一步设计了一种新型的双域深卷积编码网络(D3C2-NET),用于CS成像,具有通过所有展开的阶段传输高通量特征级图像表示的能力。关于自然图像和MR图像的实验表明,与其他最先进的艺术相比,我们的D3C2-NET实现更高的性能和更好的准确性权衡权衡。
translated by 谷歌翻译
随着计算机图形技术的开发,计算机软件合成的图像越来越接近照片。尽管计算机图形技术为我们带来了游戏和电影领域中的盛大视觉盛宴,但它也可以被不良意愿的人使用来指导公众意见并造成政治危机或社会动荡。因此,如何将计算机生成的图形(CG)与照片(PG)区分开已成为数字图像取证领域的重要主题。本文提出了基于通道关节和软杆的双流卷积神经网络。所提出的网络体系结构包括一个用于提取图像噪声信息的残差模块和一个联合通道信息提取模块,用于捕获图像的浅色语义信息。此外,我们还设计了一个残留结构,以增强特征提取并减少剩余流中信息的损失。联合通道信息提取模块可以获取输入图像的浅语义信息,该信息可以用作残差模块的信息补充块。整个网络使用Softpool来减少图像下采样的信息丢失。最后,我们融合了两个流以获得分类结果。 SPL2018和DSTOK上的实验表明,所提出的方法优于现有方法,尤其是在DSTOK数据集上。例如,我们的模型的性能超过了最先进的3%。
translated by 谷歌翻译
我们提出了一个机器人学习和计划框架,该框架以最少的共同努力生成有效的工具使用策略,能够处理不同于培训的物体。利用有限元方法(FEM)基于模拟器,该模拟器在观察到的刀具使用事件给定的细粒度,连续的视觉和物理效果中,通过提出的迭代迭代符号深化回归(IDSR)算法来识别促成效果的基本物理特性。我们进一步设计了一种基于最佳控制的运动计划方案,以整合机器人和特定于工具的运动学和动力学,以产生有效的轨迹,从而实现学习性能。在模拟中,我们证明了所提出的框架可以产生更有效的工具使用策略,这与在两个示例任务中观察到的框架截然不同。
translated by 谷歌翻译
句子完成(SC)问题提出了一个或多个需要填写的空白,三到五个可能的单词或短语作为选项。SC问题被广泛用于学习英语作为第二语言(ESL)的学生。在本文中,我们提出了一个大规模的SC数据集,\ textsc {sc-ques},该数据由292,517 ESL SC的问题组成,来自现实世界中标准化英语考试。此外,我们通过在提出的\ textsc {sc-ques}数据集上训练大规模的预训练语言模型来自动解决SC问题的全面基准。我们对基线模型的性能,限制和权衡进行详细分析。数据和我们的代码可用于研究目的:\ url {https://github.com/ai4ed/sc-ques}。
translated by 谷歌翻译
在线对话说明是在现实世界在线教育环境中使用的一系列教学说明,以激励学生,帮助了解学习材料并建立有效的学习习惯。尽管在线学习的受欢迎程度和优势,但教育技术和教育数据挖掘社区仍然缺乏缺乏大规模,高质量和良好的教学教学指导数据集来研究计算方法,以自动检测在线对话说明并进一步提高在线教学效果。因此,在本文中,我们提供了一个在线对话说明检测的数据集\ textsc {dialogId},其中包含30,431个有效的对话说明。这些教学说明很好地注释分为8个类别。此外,我们还利用了普遍的预训练的语言模型(PLM),并提出一个简单而有效的对抗训练学习范式来提高对话指导检测的质量和概括。广泛的实验表明,我们的方法的表现优于多种基线方法。数据和我们的代码可用于研究目的:\ url {https://github.com/ai4ed/dialogid}。
translated by 谷歌翻译
我们提出了一种简单但有效的方法,建议为学生提供高质量和多样性的练习。我们的方法由三个关键组成部分组成:(1)候选生成模块;(2)促进多样性的模块;(3)范围限制模块。提出的方法在召回方面提高了总体建议性能,与基线相比,推荐候选者的多样性增加了0.81 \%。
translated by 谷歌翻译